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La prdsente Invention concemo un proc6d6 d'estlmatlon de la pertinence d'un 
document par rapport & un concept. 

Un proc6d6 classlque d'estlmatlon de la pertinence d'un document par rapport d un 
concept comprend le calcul d'une fonctlon de pertinence du concept par rapport d ce 
5 document s'appuyant sur la connalssance d'un volslnage sdmantlque pr§d6tenmln6 de ce 
concept. 

On appelle volslnage sdmantlque d'un concept, un ensemble de concepts reli6s d 
ce concept par dlff§rents Hens sdmantiques dans une base de connalssances. 

En g6n6ral, lorsqu'on calcule la pertinence d'un document par rapport ^ un concept, 
10 la foncHon calcul6e prend en compte dans son estimation la presence dans le document 
du concept lul-mSme, ainsi que celle de tous les concepts appartenant k son volslnage 
s6mantiqua 

Par consequent, le r6sultat d'une requdte d'estlmatlon d'un document par rapport ^ 
un concept peut 6tre errond lorsque ce concept est ambigu, c'est ^ dire lorsqu'il comports 

15 plusieurs sens dlstinds. En effet, dans ce cas, le volslnage s6mantique du concept 
comporte des concepts volslns de sens dlff^rents de ce concept. 

Cette amblguTt§ est parfols prise en compte dans le calcul de la fonctiog de 
pertinence, en r6dulsant le r§sultat obtenu par I'estlmatlon de la presence du conceptpris 
dans un sens prdddterminS par un r6sultat obtenu par I'estlmatlon de la pr6sencp de 

20 concepts pris dans un sens different. AlnsI, par exemple, un document dans lequel la 
presence de concepts pris dans un sens different est sup6rleure e la presence de 
concepts pris dans le sens predetermine n'est plus considere comme etant pertinent par 
rapport au concept. 

Ce type de precede prenant en compte I'amblguTte du concept risque done de 
25 oonskierer un document pouvant interesser I'utllisateur comme ayant une mauvaise 
pertinence par rapport a ce concept, par exemple au cas oO une fausse detection 
d'ambiguTte advlendrait. 

L'invention a pour but de remedier & cet inconvenient en fournissant un precede 
d'estlmatlon de la pertinence d'un document par rapport ^ un concept capable de prendre 
30 en compte I'amblguTte du concept sans degrader I'estimation de la pertinence du 
document par rapport au concept. 

A cet effet, l'invention a pour objet un precede d'estlmatlon de la pertinence d'un 
document par rapport e un concept, comprenant le calcul d'une fonctlon de pertinence du 
concept par rapport k ce document s'appuyant sur la connaissance d'un volslnage 
35 semantique predetermine de ce concept, caracterise en ce qu'il comporte en outre le 
calcul d'une fonctlon d'amblguite de ce concept dans ce document, distincte de la fonction 
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de pertinence, ce calcul dtant estimd d partir de la prdsence dans le document de 
diffdrents sens de ce concept. 

Ainsi, la prise en oompte de I'amblguTtd est ddcorr6lde du caicui de la fonctlon de 
pertinence. La pertinence du document rests done inchangSe en cas d'amblguTt6, et c'est 
5 un score ddtenninant uniquement I'ambiguTtd qui avertit Tutilisateur du fait que ie 
document est susceptible de I'Intdress'er ou non. 

Dans le cas d*une fausse detection d'ambiguTtd, te document sera toujours 
considdrd comma pertinent par rapport au concept, puisque seui le score d6temiinant 
TambiguTtd est susceptible d'§tre ennond. 
10 Un procddd selon i'lnvention peut en outre comporter i'une ou plusieurs des 

caractSristiques suivantes : 



la fonctlon de pertinence mesure la presence du concept et des concepts du 
voisinage s6mant!que de ce concept dans le document ; 



le^olsinager^6mantlquerxluncx)nceptcomporterplasteorsrTrc^ 
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de sens distincts, et la fonctlon d'ambiguTtd compare la presence de 
concepts appartenant ^ un nuage s6mantique correspondant k un sens 
pr6d6termind du concept avec la presence de concepts appartenant d des 
nuages sSmantlques diff^rents ; 



20 



la presence de chacun des concepts appartenant aux diff^rents nuages 
s6manfiques est pond6r6e par un coefficient pr6d6tennin§ ; 



le proc^d6 comporte une 6tape prealable de detection de concepts ambigus, 
c'est ^ dire de concepts comportant plusieurs nuages s6mantiques de sens 
diffdrents dans leur m§me voisinage sSmantique ; 



25 



lors de l'6tape de detection pr§alable, deux concepts sont considSrds 
comma ambigus s'ils sont relies entre eux par au molns deux liens 
s6mantiques differents. 



lors de l*6tape de dStection pr6alable, un concept est consid6r6 comme 
ambigu s'il est reli§ k au molns deux nuages s6mantiques de sens 
differents ; 



30 



le concept appartient k une base de connaissance obtenue par fusion d'une 
premiere base de connaissances avec une seconde base de connaissances, 
r^tape pr§alabie de detection des concepts ambigus 6tant realises lors de la 
fusion. 



35 



lors de r6tape de d§teGtion des concepts ambigus, un concept de la 
premifere base de connaissances est consid6r6 comme ambigu s*il est rell6 
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par un nouveau lien d un autre concept de la premiere base de 
connaissances. 

lore de r^tape de detection dee concepts ambigus, un concept de la 
premidre base de connaissances est consid6r6 comme ambigu s'il est reli6 d 
au moins un nuage sdmantique de la seconde base de connaissances. 
On notera qu'on appelle nuage sdmantique d'un concept consld6r6, un ensemble 
constitud de concepts relics d un mdme sens du concept consid6r6. 

Par exemple, le concept « Orange >/ comporte dans son voislnage s6mantique au 
moins deux nuages sSmantlques de sens diffdrents, d savoir un nuage s6mantique se 
rapportant £1 la couleur orange (comportant entre autres les concepts « couleur y>, 
«Jaune», « rouge )», etc.) et te nuage sdmantique se rapportant au fruit orange 
(comportant entre autres les concepts « fruit », « agrume », « citron », etc, ). 

L'Inventlon sera mieux comprise Si la lecture de la description qui va sulvre, donn6e 
uniquement ^ titre d'exemple et faite en se r^fdrant aux dessins annexes dans lesquels : 
la figure 1 repr^sente schdmatlquement une base de connaissances 
constitute de concepts et de liens stmantiques entre eux ; .^^ 
les figures 2 et 3 reprtsentent schdmatiquement une mSthode de detection 
de concepts amblgus, mise en oeuvre dans un proc6d6 selon i'invention et; 
la figure 4 repr§sente sch§matiquement un proc6d6 d'estimation de^ la 
pertinence d'un document par rapport & un concept selon I'invention. 
Oni a repr6sent6 schtmatiquement sur la figure 1 une base de connaissances que 
Ton d§signera par la rdftrence gtndrale 10. 

On notera que, dans cet exemple, la base de connaissances 10 est constitute d'une 
base de connaissances 10A d laquelle on a ajoutt une base de connaissances 10B, 
selon un proctdt de fusion de bases de connaissances connu en soit. 

Un concept 12 de ia base de connaissances 10 est relit d d'autres concepts par des 
liens stmantiques 14. 

L'ensemble des concepts ainsi relits au concept 12 forme un voisinage stmantlque 
de ce concept 12. Ce voisinage stmantique peut comporter plusieurs nuages 
stmantiques 16 de sens distincts, un nuage stmantique 16 du voisinage du concept 12 
ttant, comme cela a ttt dtfini prtctdemment, un ensemble constitut de concepts relies 
k un meme sens du concept 12 considtrt. 

Lorsqu'un concept 12 est relit § plusieurs nuages stmantiques 16 de sens distincts. 
ce concept est dit « ambigu ». Les concepts ambigus sont designts sur la figure 1 par la 
reftrence gtntrale 18, et par les rtftrences particulitres ISA, 18B et 18C, ces references 
particulitres correspondant ^ difftrents modes de dttection des concepts amblgus, mis 
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en oeuvre tors d'une dtape prdalable d'analyse de la base de connaissances 10. Cette 
dtape sera d6taillde en r6fdrence aux figures 2 et 3. 

Durant cette dtape prdalable, les concepts possddant plusieurs nuages sdmantiques 
de sens diffdrents dans leur volsinage sdmantique sent marqute comme 6tant amblgus. 
5 La figure 2 repr^sente une mise en ceuvre de cette dtape pr6alablet adaptde pour ia 

detection de concepts ambigus dans une base de connaissances donn6e, par exemple 
ici, la base de connaissances 10A. 

Cheque concept 12 de la base de connaissances 10A est analyst lors d'une §tape 
20 durant iaqueite on recherche au moins deux liens sdmantiques diffdrents reliant ce 
10 concept 12 d un seul autre concept. 

Dans ie cas oCi ces liens existent on passe d une 6tape 21 au cours de laquelle le 
concept est marqu6 comme 6tant un concept ambigu 18A. pulsque la presence d'au 
moins deux Hens vers un mdme autre concept indique une forte probabilit6 pour que ces 

lliEnnrarxCTicer r Rg n ttl B s ree r ^ 

IS Dans le cas contraire. on passe k une dtape 22 lors de laquelle on recherche au 

moins deux Hens sdmantiques reliant ce concept 12 d deux nuages sSmantiques de sens 
difF6rents. 

Dans le cas oCi ces liens existent, le concept est par definition un concept ambigu. 
On passe alors d une dtape 23 lors de laquelle il est marqud comme dtant un concept 
20 ambigu 18B. 

Dans le cas contraire, le concept 12 n'est pas considers comme Stent ambigu, et on 
passe ^ une Stape 24 de fin d'dtape pr§alable d'analyse de la base de connaissances 
lOA^ ~ ' 

La figure 3 reprSsente une mIse en oeuvre de I'Stape pr§a)able de detection des 
25 concepts ambigus, plus particulf^rement lors de la fusion de la base de connaissances 
IDA avec la base de connaissances 10B. Les nouveaux Hens cr66s entre concepts lors 
de cette fusion sont repr6sent6s sur la figure en traits interrompus. 

Cheque concept 12 existent dans la base de connaissance 10A est alors analyst 
lors d'une Stape 25 durant laquelle on recherche au moins un nouveau lien sSmantique 
30 reliant ce concept 12 d un autre concept existent de la bese de conneissence 10A, ce 
nouveeu lien ayant 6t§ cr§6 lors de le fusion des deux beses IDA et 10B. 

Dans le cas oD un tel nouveau lien existe, on passe k une Stape 26, durant laquelle 
le concept est marqu6 comme 6tant un concept ambigu 18C, pulsque la reletion entre ces 
deux concepts n'etait pes pr6vue dens le bese de conneissences inltiele 10A, ce qui 
35 implique qu'il s'egit potentiellement d'homonymes. 
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Dans le cas contraire, on passe d une §lape 27, durant laquelle cheque concept 12 
existant dans la base de connalssance 10A est de nouveau analys6, pour rechercher au 
molns un lien s6mantlque reliant ce concept 12 a un nuage de nouveaux concepts de la 
base de connaissances 10B. 
5 Dans le cas oO un tel Hen exlste. on passe d une 6tape 28 durant laquelle le concept 

est marqu§ comma 6tant un concept amblgu 18D. pulsqu'll est probable que ce Hen vers 
ces nouveaux concepts concerne un homonyme. 

Daris le cas contraire, le concept 12 n'est pas consld6r6 comma 6tant amblgu, et on 
passe & une 6tape 29 de fin d'6tape pr6alable d'analyse de la base de connaissances. 
10 Une fols cette 6tape prfialable de recherche de concepts amblgus ©ffectu6e, 11 est 

possible d'estlmer la pertinence d'un document par rapport d un concept donn6 de la 
base de connaissances 10, par le proc6d6 repr6sent6 sch6matiquement sur la figure 4, 

Lors d'une premiere 6tape 30, une requSte d'estlmation de la pertinence d'un 
document par rapport €i un concept 12 de la base de connaissances 10 est 6mlse, par 
1 5 exemple par un moteur de recherche. 

. Une fols cette requ§te 6mlse, on passe k une 6tape 32, durant laquelle un cjalcul 
d'une fonctlon de pertinence du document par rapport au concept 12 est effectu^ de 
manl&re connue en sol. Cette fonctlon de pertinence est calcul6e en prenant en compte la 
presence dans le document du concept 12 et de concepts appartenant au volsijiage 
20 sSmantiquedece concept 12. . 

Ainsi, par exemple, la fonctlon de pertinence est donn6e par I'^quation suivante : 
Pertinence(Doc, 12) = f[Pr6sence(Doc, 12). coef x Pr6sence(Doc, volslnage(12))l, 
oD : 

Pertinence(Doc, 12) est la fonction de pertinence du concept 12 dans le 
25 document consid6r6 ; 

Pr6sence(Doc, 12) est une fonction quantiflant la presence du concept 12 
dans le document consid6r6, par exemple, le nombre de fois oCi le concept 
12 apparaTt dans le document ; 

Pr6sence(Doc. voisinage(12)) est une fonctlon quantiflant la presence dans 
30 ie document consid6r6 de concepts appartenant au voisinage du concept 

12; ' 

coef est un coefficient de ponderation predetermine, permettant de 
d'accorder plus ou moins d'importance aux concepts appartenant au 
voisinage s6mantique du concept 12 ; 
35 . f est par exemple une fonction « maximum », ou une fonctlon « somme ». 
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En fonction du rteultat obtenu par ce calcul, le document pout dtre considdrd 
comme 6tant pertinent vis d vis du concept 12. par exemple si le calcul donne un rteultat 
supdrieur d un seuH prdddtennin6. Dans ce cas, on passe d une dtape 34 au cours de 
laquetle le document est marqud comme dtant pertinent par rapport au concept 12. 

Dans le cas contraire, oCi le rteultat du calcul donne un rteultat inf§rieur au seuil 
prM^temnind, on passe 2i une 6tape 36 au cours de laquetle le document est marqud 
comme n'dtant pas pertinent par rappcnrt au concept 12. Dans ce cas, le document non 
pertinent n'est pas retenu. 

Dans le cas oO le document est marqud comme 6tant pertinent, le procMd selon 
I'Invention prdvoit ensuite le calcul d'une fonction d'amblgultd du concept dans le 
document. 

Lors d'une ^pe 38, on v6rlfie si le concept 12 sur lequel porte la requdte est 
marqud comme dtant ambigu ou non dans la base de connaissances 10. 

Si h i ' tfst payr na r q u a comme dta n t a mbigu. on passe 6 Une 6tape 4U au cours cle 

laquelle le document est marqud comme 6tant pertinent et non ambigu. 

Si le concept 12 est marqu§ comme dtant ambigu. on passe une dtape 42 durant 
laquelle on procMe d un calcul de la fonction d'ambiguTt§. comparant la presence de 
concepts appartenant d un nuage sdmantique conrespondant k un sens pr6ddtemiind du 
concept 12 (le sens du concept dans la requSte) avec la prteence de concepts 
appartenant k des nuages s^mantiques diff^rents. 

Ainsi. la fonction d'ambiguM peut §tre donn6e par i'^quation suivante : 

AmbiguTt6(IDoc, 12) = f[coef1 x Pr6sence(Doc, nuagel). coefZ x Prteence(Doc, 
nuage2)i, 

oCi : 

AmbiguTt§(Doc, 12) est la fonction d'ambiguYtS du concept 12 dans ie 
document consld^rd ; 

nuagel et nuage2 sent deux nuages s6mantiques diff^rents relite au 
concept 12 consid6r6 ; 

Pr6sence(Doc, nuagel) quantlfie la presence de concepts appartenant au 
nuage 1 dans le document considers ; 

coefl est un coefficient pr6d6termin6, pemiettant d'accorder plus ou moins 
d'importance aux concepts appartenant au nuage 1 ; 
Pr§sence(Doc, nuage2) quantifie la presence de concepts appartenant au 
nuage 2 dans le document considers ; 

coef2 est un coefficient predetermine, permettant d'accorder plus ou moins 
d'importance aux concepts appartenant au nuage 2 ; 
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f est une fonction de comparalson. 
Une fols ce score d'ambigu'itd calcul6, on passe d une 6tape 44 au cours de laquelle 
le document, est marqu6 comme pertinent avec un score d'amblguTt6, et il ne tlent ainsi 
qu'a Tutlllsateur d'estlmer. d I'aWe de ce score d'ambiguitd, si le document est susceptible 
5 de rint6resser ou non. 

II apparatt clalrement qu'un proc6d§ d'estlmatlon de la pertinence d'un document 
par rapport d un concept donn6, tel que d6crlt pr6c6demment. fournit de mellleurs 
rdsultats que les proc6d6s existants, en pond6rant la pertinence par un calcul d'ambigurtd 
sans effector I'estlmatlon de la pertinence elle-mdme. 
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REVENDICATIONS 




1. Procddd d*estimation de la pertinence d'un document par rapport & un concept 
(12), comprenant le calcul (32) d'une fonction de pertinence du concept (12) par rapport d 
5 ce document s'appuyant sur la connalssance d'un voislnage sdmantlque prdddterminS de 
ce concept (12), caract6rls6 en ce qu'il comporte en outre ie calcul (42) d'une fonction 
d'ambiguHd de ce concept (12) dans ce document, distlncte de la fonction de pertinence, 
ce calcul Stent estimd Si partir de la presence dans ie document de difF6rents sens de ce 
concept. 

10 2. Procdd§ d'estimatlon de la pertinence d'un document par rapport d un concept 

(12) selon la revendlcation 1, dans lequel la fonction de pertinence mesure la presence du 
concept (12) et des concepts du voisinage sdmantique (16) de ce concept (12) dans le 
document. 

3rPr o c 6d 6rd' es t i rn a t ion " de l a p e r Unence d tirrdocam en tTmrT app Dr f Sr an ^ ncepf 

IS (12) selon la revendlcation 1 ou 2, dans lequel, ie voisinage sSmantique de ce concept 
(12) comportant plusieurs nuages sdmantiques (16) de sens distincts, la fonction 
d'amblguitd compare la presence de concepts (12) appartenant d un nuage sSmantique 
(16) conrespondant d un sens pr6d6tennin6 du concept (12) avec la presence de 
concepts appartenant d des nuages sdmantiques (16) dIffSrents. 
20 4. Proc6d6 d'estimation de la pertinence d'un document par rapport d un concept 

(12) selon la revendication 3, dans lequel la presence de chacun des concepte 
appartenant aux diffSrents nuages sSmantiques (16) est pondSrSe par un coefficient 
pr6d6term(n6. 

5. Proc§d6 d'estimation de la pertinence d'un document par rapport d un concept 
25 (12) selon Tune quelconque des revendications 1^4, comportant une §tape pr4alable de 

detection de concepts ambigus (18), c'est k dire de concepts comportant plusieurs 
nuages s^mantiques (16) de sens diffSrents dans leur m@me voisinage s6mantique. 

6. Proc6d6 d'estlmatlon de la pertinence d'un document par rapport S un concept 
(12) selon la revendication 5, dans lequel, lors de Tetape de d6tection pr6alable, deux 

30 concepts sont consideres comme ambigus (18A) s'ils sont reli6s entre eux par au moins 
deux liens s6mantiques (14) diffSrents. 

7. Proced6 d'estimation de la pertinence d'un document par rapport § un concept 
(12) selon la revendlcation 5 ou 6, dans lequel, lors de l'6tape de detection pr§alable, un 
concept est consid§r§ comme ambigu (18B) s'il est rellS d au moins deux nuages 

35 sSmantiques (1 6) de sens diffSrents. 
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8. ProcMd d'esllmatlon de la pertinence d'un document par rapport h un concept 
(12) selon Tune quelconque des revendlcations 5 7, dans lequel, le concept (12) 
appartenant d une base de connalssance (10) obtenue par fusion d'une premlftre base de 
connalssances (10A) avec une seconde base de connalssances (10B). I'dtape prdalable 

5 de detection des concepts amblgus est r6all86e tors de la fusion. 

9. Procddd d'estlmatton de la pertinence d'un document par rapport d un concept 
(12) selon la revendlcatlon 8. dans lequel. lors de l'6tape de d6tectlon des concepts 
amblgus, un concept de la preml6re base de connalssances (10A) est consld6r6 comme 
ambigu (18C) s'll est rell6 par un nouveau lien k un autre concept de la preml6re base de 

1 0 connalssances (1 OA). 

10. Proc§d6 d'estimatlon de la pertinence d'un document par rapport k un concept 
(12) selon la revendicatlon 8 ou 9, dans lequel, lors de l'6tape de detection des concepts 
amblgus, un concept de la premiere base de connalssances (10A) est consld6r6 comme 
ambigu (18C) s'll est rell6 k au molns un nuage s6mantlque de la seconde base de 

15 connalssances (1 OB). 
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